Вступление

В августе 2017 года прошла 30 смена Летней Физико-Математической Школы. В рамках смены традиционно проводилась экономическая игра. В ходе игры слушателям школы за положительную активность начислялась виртуальная валюта, которую в конце смены можно было потратить на разные полезные штуковины.
В результате собралось внушительное количество данных о всех перемещениях виртуальных баксов в лагере. Эти данные мы и попробуем осмыслить.

Знакомство с Пионерами

Анализ суммарного заработка пионеров

Всего в лагерь приехало 100 пионеров закончивших классы с 7 по 11. Для каждого пионера известно сколько виртуальных денег он заработал в течении смены. Всего дети заработали 62234@ . В среднем на человека пришлось по 622@, самый богатый пионер накопил 1211@, а самый бедный только 136@.

Посмотрим на гистограмму отражающую заработок населения.

Не смотря на то что на вид распределение заработка по пионерам слабо отличается он нормального, считать его нормальным мы не можем из за трех значений в самой правой части графика. Эти значения слишком сильно отклоняются от среднего чтобы принять гипотезу о нормальности распределения. Зато если их выкинуть, то оставшиеся значения будут распределены вполне себе нормально (Значение p-value для теста Шапиро-Уилка = 0.1321561).

На время уберем трех самых богатых пионеров из выборки и построим такие же гистограммы разделив пионеров на группы по калассам.
Нормальность распределения внутри группы сохраняется. Значения p-value для теста Шапиро-Уилка по классам приведены в таблице.

Значеня p-value для теста Шапиро-Вилка при делении на группы по классу
Класс 7 8 9 10
p-value 0.7047179 0.6872683 0.6834437 0.4396516

На гистограммах оранжевым отмечено среднее значение заработка по всей выборке, а красным – внутри гурппы. Красным пунктиром выделены доверительные интервалы среднего значения. Так как из 11 класса приехало всего два человека, их рассматривать не будем.

Из графиков видно что средний заработок 10 класса значимо отличается от среднего заработка 8 и 9 классов.

Составляющие успеха

Для каждого из слушателей собрана статистика не только о суммарном заработке за смену, но и о заработке в отдельных категориях, таких как например “Учебная деятельность” или “Участие в мероприятиях” и даже “Посещение заряки” и “Чистка картошки”. Посмотрим как могут быть связаны между собой эти показатели.
Всего для каждого из пионеров собрано более 70 различных значений. Разумеется большинство пар измерений никак не связаны между собой и рассмотривать их нет смысла. Выберем несколько интересующих нас областей и попробуем найти взаимосвязи внутри них.

  1. Связь не денежных показателей с сумарным заработком и заработком в связанных категориях.
  2. Связь разных направлений учебной деятельности.
  3. Связь факта покупки книги с категориями заработка
  4. Связь заработка за спорт с заработком за учебу

Связь не денежных показателей с сумарным заработком

Всего у нас 11 не связанных напрямую с деньгами показателей. Это счетчики посещений лекций, лабораторий, факультативов, зарядок и семинаров. Счетчкики пропусков и сертификаты на книжки.
Большинство этих величин так или иначе косвенно связаны с заработком. Так например посещение лаборатории всегда означает денежное вознаграждение за сдачу отчета и тому подобное.
Есть только два действительно не связанных на прямую с деньгами показателя. Это посещения семинаров и посещения зарядки. За посещение семинаров слушатели не получают денег совсем, а за зарядку хоть и платят, но на столько мало, что существенного вклада в общую картину эта сумма внести не может.

Связь количества посещенных семинаров с сумарным заработком

Отложим на графике по X количество посещенных семинаров, а по Y все ту же сумму заработанных за смену денег.

Можно заметить небольшой ниcходящий тренд. Но может быть нам только кажется ? Давайте построим линейную модель.

Параметры линейной модели зависимости заработка за смену от количества посещенных семинаров
Estimate Std. Error t value Pr(>|t|)
(Intercept) 707.253883 39.6091 17.855844 0.0000000
Количество_посещенных_семинаров -8.534059 3.5480 -2.405315 0.0180352

Действительно, видим что p-value для количества семинаров < 0.05 а значит можно утверждать что посещение семинаров влияет на сумарный заработок. Как видно из коэфицентов модели, каждый посещенный семинар в среднем на 8@ уменьшает заработок пионера.
Это и не удивительно. За семинары не платят денег, а вместо того чтобы слушать семинары можно пойти на факультатив или сделать лабу. В среднем за факультатив на протяжении смены получали по 6.46@ что как раз попадает в доверительные интервалы коэфицента при семинарах в линейной модели (- 8.5 +- 3.5)

Еще более явно эту взаимосвязь можно увидеть если построить зависимость заработанных за учебу денег от количества посещенных семинаров. Построим такой график, а заодно отобразим на нем линию тренда предсказанную линейной моделью.

Видим что 1. Заработок за учебу сильно корелирует с заработком за смену, что не удивительно. 2. Заработок за учебу еще сильнее подвержен влиянию количества посещенных семинаров. В этой модели каждый посещенный семинар уменьшает ожидаемый заработок за учебу уже на целых -15.97@.

Связь количества посещенных зарядок с сумарным заработком

Для начала проверим, ходил ли кто-нибудь вообще на зарядку в этой смене.

Больше половины пионеров на зарядке не появились ни разу. Зато из тех кто продержался и не бросил после первых двух раз больше половины доходили до самого конца (>10).
Построим ящики с усами чтобы проверить есть ли какие-нибудь значимые различия между мощными парнями и девчонками сходившими три и более раз на зарядку и остальным лагерем.

К сожалению явных различий не видно. Коэфиценты дисперсионного анализа подтверждают отстутствие взаимосвязи. При сравнении заработка p-value = 0.5417886, а при сравнении заработка только за спорт p-value = 0.5636234.

Связь разных направлений учебной деятельности

В лагере множество способов получить новые знания. Как мы уже выяснили посещение большого количества семинаров отрицательно влияет на общий заработок за учебу, а как на счет остальных областей? И есть ли связь между различными областями?

Деньги за учебу начислялись в семи категориях. Для того чтобы выяснить какие из этиъ категорий действительно связаны между собой посмотрим на значения p-value для коэфицентов кореляции Пирса между всеми парами.
Нулевая гипотеза здесь говорит о том что коэфицент кореляции = 0

Значения p-value
Кружки Факультативы Лабы Олимпиады Проведение_семинара Решение_убойных_задач Экзамен
Кружки 0.0000000 1.0000000 0.0977896 0.0673297 1.0000000 0.5582816 0.0011831
Факультативы 0.1945652 0.0000000 0.0361132 0.0000187 1.0000000 0.0001350 0.0086309
Лабы 0.0088900 0.0027779 0.0000000 0.0011831 1.0000000 0.6669343 0.0345235
Олимпиады 0.0056108 0.0000010 0.0000696 0.0000000 1.0000000 0.0000044 0.0000007
Проведение_семинара 0.7670485 0.2493558 0.4734310 0.6664957 0.0000000 1.0000000 1.0000000
Решение_убойных_задач 0.0620313 0.0000075 0.0833668 0.0000002 0.8807241 0.0000000 0.0977896
Экзамен 0.0000717 0.0005754 0.0024660 0.0000000 0.7512918 0.0091047 0.0000000

Видим что почти все переменные, за исключением разве что Кружков и Семинаров, значимо корелируют между собой. Отбросим не интересные слабо корелирующие показатели и выведем значения самого коэфицента кореляции для оставшихся пар.

Коэфицент кореляции Пирса для доходов за учебу
Факультативы Лабы Олимпиады Решение_убойных_задач Экзамен
Факультативы 1.0000000 0.2961138 0.4667705 0.4312249 0.3383368
Лабы 0.2961138 1.0000000 0.3870170 0.1740118 0.2995313
Олимпиады 0.4667705 0.3870170 1.0000000 0.4905798 0.5188702
Решение_убойных_задач 0.4312249 0.1740118 0.4905798 1.0000000 0.2595864
Экзамен 0.3383368 0.2995313 0.5188702 0.2595864 1.0000000

Все кореляции положительные. Что не удивительно. Те кто много ботают ботают везде. Построим пару графиков чтобы проилюстрировать этот незатейливый факт.

Хорошо пишущие экзамен ребята часто выполняют больше лаб чем необходимо.

Связь факта покупки книги с категориями заработка

Существует как минимум три основных пути потратить деньги в лагере. 1. Купить книжку 2. Заказать что-то из магазина в городе 3. Купить лот на аукционе

Посмотрим, определяет ли то откуда деньги появились то на что они будут потрачены.

Сложно сказать что-то определенное. Оставим выводы на на усмотрение читателя.
Покупайте книжки. Особенно если заработали кучу баксов на соревнованиях по армреслингу.

Связь заработка за спорт с заработком за учебу

Да, здесь просиходит именно то что вы думаете. Чем больше пионер заработал на спорте, тем меньше он получил за учебу. В среднем один спортивный бакс = -2 учебным. И зарядка тут не при чем.

Коэфиценты линейной модели предсказания заработка за учебу по заработку за спорт
Estimate Std. Error t value Pr(>|t|)
(Intercept) 516.019927 24.1783573 21.342224 0.0000000
Заработок_за_спорт -1.864202 0.4870126 -3.827832 0.0002278

Общие тренды

В заключение главы про слушателей ЛФМШ, давайте попробуем выделить основные тенденции связи заработка в разных общих категориях.
Выделим четыре основных не пересекающихся источника дохода и посмотрим как связаны между собой показатели пионеров по этим статьям.

Видно что переменные не совсем независимы. Какая-то связь определенно присутствует. При помощи метода главных компонент попробуем найти две новые оси которые объяснили бы максимум изменчивости данных и построим график в новых осях.

Полученные главные компоненты объясняют 0.94% изменчивости исходных данных. Что вполне себе не плохо.
Из графика видно, что успех в Спорте почти обязательно связан с успехом на Мероприятиях и существенным доходом от работы. Кроме того можно заметить что самые богатые пионеры скорее сколотили свое состояние именно интелектуальным трудом, нежли чем-то еще. И при этом успехи в учебе очень слабо отрицательно корелируют с доходом за спорт и работу, и совсем не связаны с величиной гонораров за победу в мероприятиях.

Все эти чисто визуальные заключения подтверждаются значениями p-value для коэфицентов кореляции рассмотренных параметров.[^1](####Коэфиценты кореляции и значения p-value для 4 основных статей дохода)

Чтобы окончательно закрыть вопрос со связью рассматриваемых параметров давайте построим линейную модель зависимости заработка за меропирятие от других трех величин.

Estimate Std. Error t value Pr(>|t|)
(Intercept) -6.8126501 19.7433485 -0.3450605 0.7308037
Спорт 0.9042482 0.1629714 5.5485097 0.0000003
Учеба 0.0772444 0.0326869 2.3631585 0.0201361
Работа 0.4385725 0.1084037 4.0457349 0.0001055

Все предикторы оказались значимыми, кроме разве что, смещения.

Денежные течения

В этой главе рассмотрим то откуда в основном деньги брались в лагере и на что в итоге тратились. Без привязки к конкретным пионерам.[^3] [^3](#### Все рассмотренные типы транзакций)

Из графика видно что сумма выданая пионерам за прохождение обязательной учебной программы, почти равна сумме снятой в виде подушного налога. А все остальные начисления, включая начальный капитал, пионеры потратили на покупки в магазине.
Это немного расходится с изначально заложенной в экономическую игру формулой Налоги = Начальное начисление + Обязательная учебная программа. Получается что даже ничего не делая сверх необходимости можно не только досидеть до конца смены, но и накопить сумму примерно равную начальному начислению.
В чем же дело ?

Обязательная-не-обязательная программа

Давайте посмотрим из чего состоит обязательная учебная программа, и все ли начисления по этой статье действительно были неизбежны.

Каждый пионер за смену обязан провести один семинар, сдать два экзамена по лекциям и сделать две лабораторных работы. Если пионер закончил хотя бы девять классов, то тогда обязательной является также сдача зачета по факультативу, а если нет, то придется сделать еще одну лабу.
Сдать экзамен больше двух раз, как ни крути, не получится. Провести больше одного семинара можно, но занимаются этим как правило не больше одного-двух человек за смену. А вот с факультативами и лабами дела обстоят иначе.
Давайте выясним, сколько зачетов за факультатив и отчетов по лабам сдавались не из-за необходимости выполнять прогармму, а сверх нормы.

Сначала разберемся с семинарами.

Семинары

Всего девятикласников и десятикласников в лагерь приехал 71 человек, однако зачетов по факультативам было получено целых 180, почти по два зачета на человека! (всего в лагере было ровно 100 детей) Среднее начисление за зачет составило 34.03@. В итоге, по статье “Обязательная учебная программа” за дополнительные зачеты по факультативу было получено 3526@ 1, больше половины выданных за факультативы денег. Эту сумму можно смело перенести в статью “Необязательная учебная программа”, так как никто не заставлял слушателей так нажимать на бедных ведущих факультативов.

Лабораторные работы

С лабораторными работами можно провести те же самые выкладки. Получим следующие результаты

Статистика по сделанным в лагере лабораторным работам
Нужно было сделать Сделали Средний заработок за одну (@) Дополнительные деньги за лишние лабы (@)
229 378 28.96 4533.799

Итого мы нашли больше 8000@ прошедших по статье “Обязательная учебная прогрмма” которые на самом деле не являлись обязательными. Получается что если пионер не будет делать ничего сверх нормы, то у него останется на 80@ меньше чем мы посчитали в начале главы. Всего 50@ что не так уж и много.

Покупательная способность собаки

Посмотрим теперь на что тратились деньги. И попробуем установить реальный курс @ к ₽.

Книги в нашем магазине шли 1:1 с рублем. По категории “услуги” проходили только фотографии, и продавались они так же 1:1 с принятой на большей територии страны валютой. Остальное оценить сложнее.
Привезенные из городских магазинов товары, как правило, торговались по курсу 1₽ : 1.5@. Однако в этой категории так же были проданы две путевки[^3], в сумме за 10К@. Что примерно в два раза дешевле рыночной цены в рублях и составляет больше половины трат в категории.
Еще сложнее оценить коэфицент для аукциона. Нету такой цифры, которая могла бы в рублях отразить ценность обеда за столом педсостава.
Установим курс за аукцион как 3:1, а товары поделим на 2 части. Путевки продавались по курсу 2:1, а все остальное – 1:1.5.
Тогда вычисляя общую покупательную способность @ в рублях получим:

Книги/1 + Аукцион * 3 + Путевка * 2 + Товары/1.5 + Услуги/1 = Сумма в рублях = 11577/1 + 6256 * 3 + 9900 * 2 + 7983/1.5 + 750/1 =
56217 ₽

56217₽ реальных денег было необходимо чтобы обеспечить 36466@ едениц игровой валюты.
Таким образом получаем реальный курс ₽ к @ – 1.54 рубля за бакс! (или 0.65@ за ₽)

Динамика по времени

До сих пор мы ограничивались рассмотрением финальных показателей по итогам смены. Давайте взглянем на то, как эти числа формировались на протяжении смены.

На общем графике хорошо видны первый и второй аукционы, экзамены и, конечно, финальный магазин.
Мы уже знаем что половину доходов пионеров составили начисления за учебу. Посмотрим как меняются доходы за учебу и за все остальное с течением времени.

Четко видны два конца недели, когда резко возрастает объем начислений за учебу за счет экзамена и олимпиад, но падает за все остальное, потому что меньше спорта и мероприятий с призами происходит в выходные.

До сих пор говоря о доходе мы имели в виду суммарное изменение баланса, но на самом деле изменения складываются из доходов и расходов. Отложим их отдельно.

Все те же события хорошо видны на графиках. Два экзамена, два аукциона, финальный магазин.

И на последок, рассмотрим динамику посещений зарядок и семинаров в течении смены.

Этот график к сожалению cодержит некоторое количество не совсем достоверных данных, потому что доволно много транзакций попадало в банк не сразу или заносились с ошибками. Поэтому здесь мы можем видеть например посещения семинара в выходной (19 число – суббота). Но, что есть, то есть.

Вот и все.
Спасибо за внимание.

Приложение

Коэфиценты кореляции и значения p-value для 4 основных статей дохода

Коэфиценты кореляции
Мероприятия Работа Спорт Учеба
Мероприятия 1.0000000 0.3918646 0.4921385 -0.0823999
Работа 0.3918646 1.0000000 0.2295083 -0.3444417
Спорт 0.4921385 0.2295083 1.0000000 -0.3606474
Учеба -0.0823999 -0.3444417 -0.3606474 1.0000000
Значения p-value
Мероприятия Работа Спорт Учеба
Мероприятия 0.0000000 0.0002767 0.0000012 0.4150572
Работа 0.0000553 0.0000000 0.0432398 0.0013487
Спорт 0.0000002 0.0216199 0.0000000 0.0009113
Учеба 0.4150572 0.0004496 0.0002278 0.0000000

Все рассмотренные типы транзакций.

В названиях типа префиксы “Общие” и “Частные” означают группирующие типы. Так например тип “Общие Учеба” включает в себя типы “Частные Обязательная учебная программа” и “Частные Необязательная учебная программа” а каждый из них включает в себя все остальные типы относящиеся к классу “Учеба”

# Название типа Количество Среднее занчение Количество элементарных начислений Сумма Максимум Минимум Медиана Среднее
1 Потрачено сертификатов 38 -111.447368 39 -4235 -50.00000 -282.000000 -100.000000 -108.589744
2 Пропуск Лекции 5 1.800000 9 9 1.00000 1.000000 1.000000 1.000000
3 Проведение семинара 101 1.009901 102 102 1.00000 1.000000 1.000000 1.000000
4 Зачет за факультатив 11 16.363636 180 180 1.00000 1.000000 1.000000 1.000000
5 Зарядка 14 20.642857 289 289 1.00000 1.000000 1.000000 1.000000
6 Отчет по лабораторной работе 173 2.011561 348 348 1.00000 1.000000 1.000000 1.000000
7 Посещение факультатива 67 14.701493 985 985 1.00000 1.000000 1.000000 1.000000
8 Посещение семинара 100 9.950000 995 995 1.00000 1.000000 1.000000 1.000000
9 Посещение лекции 13 91.307692 1187 1187 1.00000 1.000000 1.000000 1.000000
10 Получено сертификатов 25 224.000000 112 5600 50.00000 50.000000 50.000000 50.000000
11 Общие Покупка 130 -280.507692 357 -36466 -1.00000 -621.000000 -62.000000 -102.145658
12 Общие Технические Типы 20 -1241.250000 1993 -24825 130.00000 -25.000000 -23.000000 -12.456096
13 Общие Штрафы 33 -22.363636 54 -738 -1.00000 -125.000000 -10.000000 -13.666667
14 Общие Другое 22 47.909091 63 1054 188.00000 1.000000 10.000000 16.730159
15 Общие Переводы 51 30.137255 53 1537 239.00000 1.000000 15.000000 29.000000
16 Общие Спорт 36 100.027778 554 3601 20.00000 1.000000 1.562500 6.500000
17 Общие Оплата труда 135 34.229630 352 4621 72.00000 1.000000 12.000000 13.127841
18 Общие Мероприятие 42 192.119048 363 8069 130.00000 3.000000 20.000000 22.228650
19 Общие Учеба 308 145.743506 1063 44889 165.00000 -40.000000 30.000000 42.228598
20 Частные Налог 19 -1990.789474 1893 -37825 -5.00000 -25.000000 -24.000000 -19.981511
21 Частные Покупка 130 -280.507692 357 -36466 -1.00000 -621.000000 -62.000000 -102.145658
22 Частные Невыполнение требований учебной программы 6 -72.500000 15 -435 -10.00000 -125.000000 -15.000000 -29.000000
23 Частные Нарушения общего характера 27 -11.222222 39 -303 -1.00000 -20.000000 -5.000000 -7.769231
24 Частные Другое 22 47.909091 63 1054 188.00000 1.000000 10.000000 16.730159
25 Частные Личный перевод 51 30.137255 53 1537 239.00000 1.000000 15.000000 29.000000
26 Частные Работа в столовой 34 61.764706 154 2100 30.00000 10.000000 12.000000 13.636364
27 Частные Помощь 101 24.960396 198 2521 72.00000 1.000000 7.000000 12.732323
28 Частные Участие в спортивном мероприятии 36 100.027778 554 3601 20.00000 1.000000 1.562500 6.500000
29 Частные Мероприятие 17 216.470588 212 3680 50.00000 6.153846 16.666667 17.358491
30 Частные Гонорары 25 175.560000 151 4389 130.00000 3.000000 20.000000 29.066225
31 Частные Необязательная учебная программа 20 388.200000 239 7764 165.00000 6.000000 28.000000 32.485356
32 Частные Субсидии 1 13000.000000 100 13000 130.00000 130.000000 130.000000 130.000000
33 Частные Обязательная учебная программа 288 128.906250 824 37125 140.48832 -40.000000 30.000000 45.054612
34 Ежедневный налог 19 -1990.789474 1893 -37825 -5.00000 -25.000000 -24.000000 -19.981511
35 Покупка товаров 41 -436.170732 233 -17883 -1.00000 -414.000000 -46.000000 -76.751073
36 Покупка книг 55 -210.490909 58 -11577 -36.00000 -621.000000 -193.000000 -199.603448
37 Покупка на аукционе 39 -160.410256 53 -6256 -15.00000 -340.000000 -90.000000 -118.037736
38 Покупка услуг 3 -250.000000 13 -750 -15.00000 -150.000000 -40.000000 -57.692308
39 Невыполнение нормы по посещению занятий обязательной учебной программы 1 -285.000000 6 -285 -15.00000 -125.000000 -35.000000 -47.500000
40 Пропуск лекции 5 -30.000000 9 -150 -10.00000 -50.000000 -10.000000 -16.666667
41 Нарушение распорядка дня 6 -19.500000 14 -117 -5.00000 -15.000000 -5.000000 -8.357143
42 Штраф 12 -8.333333 16 -100 -1.00000 -20.000000 -5.000000 -6.250000
43 Аморальное поведение 3 -13.000000 3 -39 -7.00000 -20.000000 -12.000000 -13.000000
44 Нарушение техники безопасности 4 -8.000000 4 -32 -7.00000 -10.000000 -7.500000 -8.000000
45 Упортребление ненормативной лексики 2 -7.500000 2 -15 -5.00000 -10.000000 -7.500000 -7.500000
46 Помощь оформителям 23 12.739130 34 293 30.00000 1.000000 5.000000 8.617647
47 Дневное Мероприятие 2 150.000000 19 300 17.14286 13.333333 16.666667 15.789474
48 Зарядка 14 25.428571 289 356 3.12500 1.000000 1.041667 1.231834
49 Помощь рубке 21 20.857143 40 438 30.00000 3.000000 10.000000 10.950000
50 Решение убойных задач 5 149.000000 24 745 165.00000 10.000000 20.000000 31.041667
51 Чистка картошки 14 64.285714 55 900 30.00000 12.000000 15.000000 16.363636
52 Начисление общего назначения 22 47.909091 63 1054 188.00000 1.000000 10.000000 16.730159
53 Дежурство в столовой 20 60.000000 99 1200 20.00000 10.000000 12.000000 12.121212
54 Личный перевод 51 30.137255 53 1537 239.00000 1.000000 15.000000 29.000000
55 Помощь педсоставу 57 31.403509 124 1790 72.00000 1.000000 7.000000 14.435484
56 Спортивное Мероприятие 22 147.500000 265 3245 20.00000 5.000000 10.000000 12.245283
57 Зачет по кружку 12 275.583333 85 3307 65.00000 12.000000 40.000000 38.905882
58 Вечернее Мероприятие 15 225.333333 193 3380 50.00000 6.153846 16.666667 17.512953
59 Олимпиада 3 1237.333333 130 3712 147.00000 6.000000 18.000000 28.553846
60 Гонорар 25 175.560000 151 4389 130.00000 3.000000 20.000000 29.066225
61 Проведение семинара 103 49.417476 103 5090 90.00000 -40.000000 50.000000 49.417476
62 Зачет по факультативу 11 534.818182 180 5883 80.00000 5.000000 30.000000 32.683333
63 Лабораторная работа 173 60.069364 348 10392 80.00000 1.000000 30.000000 29.862069
64 Начальное начисление 1 13000.000000 100 13000 130.00000 130.000000 130.000000 130.000000
65 Экзамен 2 7880.000000 193 15760 140.48832 0.000000 84.320059 81.658031

  1. Для расчета этого показателя мы для каждого перевыполнившего план пионера умножили его средний заработок за факультативы на количество “лишних” зачетов. Такой способ вычисления является более точным и сумма немного отличается от среднего за зачет умноженного на лишние зачеты. По факту выходит что каждый лишний зачет стоил немного меньше среднего, вероятно из-за того что лишние зачеты часто получали по факультативам идущим только половину смены.